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CAA54576 661 aa .linear PLN 24-MAY-1995 

N2042 [Saccharomyces cerevisiae] . 

CAA54576 

CAA54576.1 GI:496725 

embl locus SCN201952, accession X77395. 1 

Saccharomyces cerevisiae (baker's yeast) 
Saccharomyces cerevisiae 

Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes ; 

Saccharomycetales; Saccharomycetaceae; Saccharomyces. 

1 

Verhasselt, P. , Aert,R., Voet,M. and Volckaert,G. 

Twelve open reading frames revealed in the 23.6 kb segment flanking 
the centromere on the Saccharomyces cerevisiae chromosome XIV right 
arm 

1355-1361 (1994) 



FEATURES 

source 



ORIGIN 



Yeast 10 (10) , 
95208356 
7900425 

2 {residues 1 to 661) 
Volckaert, G. 
Direct Submission 

Submitted (31-JAN-1994) G. Volckaert, Laboratory of Gene 
Technology., Catholic University of Leuven, W. Decroylaan 42, 3001 
Leuven, BELGIUM 

Location/Qualifiers 
1..661 

/organism="Saccharomyces cerevisiae" 
/strain="FY1679" 
/db_xref="taxon: 4932" 
/chromosome="XIV" 

/map="centromeric region (right arm)" 
/clone="cosmid 14-20" 
/clone__lib="B. Dujon (Paris)" 
1. .661 

/name="N2042" 
1..661 

/gene="N2042" 

/coded_by="X77395. 1:11755. . 13740" 
/db_xref="GOA: P40345" 
/ db_x r e f = " SG D : S0005291 " 
/db_xref="SWISS-PROT: P40345" 

1 mgtlfrrnvq nqksdsdenn kggsvhnkre srnhihhqqg lghkrrrgis gsakrnergk 
61 dfdrkrdgng rkrwrdsrrl ifilgaflgv llpfsfgayh vhnsdsdlfd nfvnfdslkv 
121 ylddwkdvlp qgissfiddi qagnystssl ddlsenfavg kqlirdynie akhpvvmvpg 
181 vistgieswg vigddecdss ahfrkrlwgs fymlrtmvmd kvcwlkhvml dpetgldppn 
241 ftlraaqgfe stdyfiagyw iwnkvfqnlg vigyepnkmt saaydwrlay ldlerrdryf 
301 tklkeqielf hqlsgekvcl ighsmgsqii fyfmkwveae gplygnggrg wvnehidsfi 
361 naagtllgap kavpalisge mkdtiqlntl amyglekffs riervkmlqt wggipsmlpk 
421 geeviwgdmk sssedalnnn tdtygnfirf erntsdafnk nltmkdainm tlsispewlq 
481 rrvheqysfg yskneeelrk nelhhkhwsn pmevplpeap hmkiyciygv nnpterayvy 
541 keeddssaln ltidyeskqp vfltegdgtv plvahsmchk waqgaspynp aginvtivem 
601 khqpdrfdir ggaksaehvd ilgsaelndy ilkiasgngd lveprqlsnl sqwvsqmpfp 
661 m 
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SCN201952 23901 bp DNA linear PLN 24-MAY-1995 

S. cerevisiae N2019, N2021, N2023, N2025, N2027, N2031, N2048 and 
N2050 genes. 
X77395 

X77395.1 GI:496717 

mitochondrial citrate synthase; PRP2 gene; RNA polymerase III; 
RNA-dependent ATPase; rpc34 gene; tau34 protein; tRNA-Asn; 
t RNA- Pro; uridine kinase; URK1 gene; yun34 gene. 
Saccharomyces cerevisiae . 
Saccharomyces cerevisiae 

Eukaryota; Fungi; Ascomycota; Saccharomycotina; Saccharomycetes ; 
Saccharomycetales; Saccharomycetaceae; Saccharomyces . 

1 (bases 1 to 23901) 

Verhasselt, P. , Aert,R., Voet,M. and Volckaert,G. 

Twelve open reading frames revealed in the 23.6 kb segment flanking 
the centromere on the Saccharomyces cerevisiae chromosome XIV right 
arm 

Yeast 10 (10), 1355-1361 (1994) 

2 (bases 1 to 23901) 
Volckaert,G. 

Direct Submission 

Submitted ( 31- JAN-1994 ) G. Volckaert, Laboratory of Gene 
Technology, Catholic University of Leuven, W. Decroylaan 42, 3001 
Leuven, BELGIUM 



Query Match 100.0%; Score 1986; DB 8; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 1986; Conservative 0; Mismatches 



Length 23901; 
0; Indels 0; Gaps 
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AT GGG CAC AC T G T T T CG AAG AAAT G T C C AG AAC C AAAAG AGT GAT T C T GAT G AAAAC AAT 60 
. I I I I I I I I I I I I I I I I! M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
AT G G G CAC AC T G T T T C G AAG AAAT G T C C AG AAC C AAAAG AG TGATTCTGAT G AAAAC AAT 11814 

AAAGGGGGTTCTGTTCATAACAAGCGAGAGAGCAGAAACCACATTCATCATCAACAGGGA 120 
M I I I I I I I I I I I I II I I I I I I I I I I I I I I || I | | | | | | | | M | | | | | | | | | | M | | M I 
AAAGGGGGTTCTGTTCATAACAAGCGAGAGAGCAGAAACCACATTCATCATCAACAGGGA 1187 4 

TTAGGCCATAAGAGAAGAAGGGGTATTAGTGGCAGTGCAAAAAGAAATGAGCGTGGCAAA 180 
I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I || I || I I 
TTAGGCCATAAGAGAAGAAGGGGTATTAGTGGCAGTGCAAAAAGAAATGAGCGTGGCAAA 11934 

GAT T T C G AC AG G AAAAG AG ACG G G AACG G TAG AAAAC G T T G GAG AG AT T C C AG AAG AC T G 24 0 

M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I 

GAT T T C G AC AGG AAAAG AG ACGG G AAC GG TAG AAAAC G T T GG AGAG AT T C C AGAAGAC T G 11994 



ATTTTCATTCTTGGTGCATTCTTAGGTGTACTTTTGCCGTTTAGCTTTGGCGCTTATCAT 
I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
ATTTTCATTCTTGGTGCATTCTTAGGTGTACTTTTGCCGTTTAGCTTTGGCGCTTATCAT 



300 



12054 



360 



GTTCATAATAGCGATAGCGACTTGTTTGACAACTTTGTAAATTTTGATTCACTTAAAGTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I II I I I I I I II 
GTTCATAATAGCGATAGCGACTTGTTTGACAACTTTGTAAATTTTGATTCACTTAAAGTG 12114 

TATTTGGATGATTGGAAAGATGTTCTCCCACAAGGTATAAGTTCGTTTATTGATGATATT 4 20 
I I I M I I I I I I I I M I I I II I I I I I I I I II I I I I I I II I I I I I I M I I I I I I | | | | | | | | 
TATTTGGATGATTGGAAAGATGTTCTCCCACAAGGTATAAGTTCGTTTATTGATGATATT 1217 4 



4 21 CAGGCTGGTAACTACTCCACATCTTCTTTAGATGATCTeAGTGAAAATTTTGCCGTTGGT 4 80 
I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12175 CAGGCTGGTAACTACTCCACATCTTCTTTAGATGATCTCAGTGAAAATTTTGCCGTTGGT 12234 

481 AAACAACTCTTACGTGATTATAATATCGAGGCCAAACATCCTGTTGTAATGGTTCCTGGT 54 0 

I I I I I I I I I I II I I I I I II I I I I II I I I I II I I I I I I II I I I I I I II II I I I I I I I I I II 
12235 AAACAACTCTTACGTGATTATAATATCGAGGCCAAACATCCTGTTGTAATGGTTCCTGGT 12294 

541 GTCATTTCTACGGGAATTGAAAGCTGGGGAGTTATTGGAGACGATGAGTGCGATAGTTCT 600 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
12295 GTCATTTCTACGGGAATTGAAAGCTGGGGAGTTATTGGAGACGATGAGTGCGATAGTTCT 12354 

601 GCGCATTTTCGTAAACGGCTGTGGGGAAGTTTTTACATGCTGAGAACAATGGTTATGGAT 660 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12355 GCGCATTTTCGTAAACGGCTGTGGGGAAGTTTTTACATGCTGAGAACAATGGTTATGGAT 12414 

661 AAAGTTTGTTGGTTGAAACATGTAATGTTAGATCCTGAAACAGGTCTGGACCCACCGAAC 720 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
12415 AAAGTTTGTTGGTTGAAACATGTAATGTTAGATCCTGAAACAGGTCTGGACCCACCGAAC 1247 4 

721 TTTACGCTACGTGCAGCACAGGGCTTCGAATCAACTGATTATTTCATCGCAGGGTATTGG 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
12475 TTTACGCTACGTGCAGCACAGGGCTTCGAATCAACTGATTATTTCATCGCAGGGTATTGG 12534 

781 ATTTGGAACAAAGTTTTCCT^AAATCTGGGAGTAATTGGCTATGAACCCAATAAAATGACG 84 0 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
12535 ATTTGGAACAAAGTTTTCCAAAATCTGGGAGTAATTGGCTATGAACCCAATAAAATGACG 12594 

841 AGTGCTGCGTATGATTGGAGGCTTGCATATTTAGATCTAGAAAGACGCGATAGGTACTTT 900 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12595 AGTGCTGCGTATGATTGGAGGCTTGCATATTTAGATCTAGAAAGACGCGATAGGTACTTT 12 654 

901 ACGAAGCTAAAGGAACAAATCGAACTGTTTCATCAATTGAGTGGTGAAAAAGTTTGTTTA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12655 ACGAAGCTAAAGGAACAAATCGAACTGTTTCATCAATTGAGTGGTGAAAAAGTTTGTTTA 12714 

961 ATTGGACATTCTATGGGTTCTCAGATTATCTTTTACTTTATGAAATGGGTCGAGGCTGAA 1020 

II I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12715 ATTGGACATTCTATGGGTTCTCAGATTATCTTTTACTTTATGAAATGGGTCGAGGCTGT^A 1277 4 

1021 GGCCCTCTTTACGGTAATGGTGGTCGTGGCTGGGTTAACGAACACATAGATTCATTCATT 1080 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12775 GGCCCTCTTTACGGTAATGGTGGTCGTGGCTGGGTTAACGAACACATAGATTCATTCATT 12834 

1081 AATGCAGCAGGGACGCTTCTGGGCGCTCCAAAGGCAGTTCCAGCTCTAATTAGTGGTGAA 114 0 
I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
128 35 AATGCAGCAGGGACGCTTCTGGGCGCTCCAAAGGCAGTTCCAGCTCTT^ATTAGTGGTGAA 128 94 

1141 ATGAAAGATACCATTCAATTAAATACGTTAGCCATGTATGGTTTGGAAAAGTTCTTCTCA 1200 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
128 95 ATGAAAGATACCATTCAATTAAATACGTTAGCCATGTATGGTTTGGAAAAGTTCTTCTCA 12 954 

1201 AGAATTGAGAGAGTAAAAATGTTACAAACGTGGGGTGGTATACCATCAATGCTACCAAAG 12 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12955 AGAATTGAGAGAGTAAAAATGTTACAAACGTGGGGTGGTATACCATCAATGCTACCAAAG 13014 



Qy 12 61 GG AG AAG AG G T CAT T T GGG GGG AT ATG AAG T CAT C T T C AGAG GAT G CAT T GAAT AAC AAC 1320 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 13015 GGAGAAGAGGTCATTTGGGGGGATATGAAGTCATCTTCAGAGGATGCATTGAATAACAAC 13074 

Qy 1321 AC T G AC AC AT ACG GC AAT T T C AT T C GAT T T G AAAG G AAT AC GAG C GAT G C T T T C AAC AAA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 13075 AC T GAC AC AT ACG GC AAT T T CAT T C GAT T T G AAAGG AAT ACGAGC G AT G C T T T C AAC AAA 13134 

Qy 1381 AAT T T GAC AAT GAAAG AC G C CAT T AAC AT GAC AT T AT C GAT AT C AC C T GAAT G G C T C C AA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 13135 AAT T T GAC AAT GAAAG AC G C CAT T AAC AT GAC AT T AT C GAT AT C AC C T GAAT GGC T C C AA 13194 

Qy 14 41 AGAAGAGTACATGAGCAGTACTCGTTCGGCTATTCCAAGAATGAAGAAGAGTTAAGAAAA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I 
Db 13195 AGAAGAGTACATGAGCAGTACTCGTTCGGCTATTCCAAGAATGAAGAAGAGTTAAGAAAA 13254 

Qy 1501 AATGAGCTACACCACAAGCACTGGTCGAATCCAATGGAAGTACCACTTCCAGAAGCTCCC 1560 

I I II II I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 13255 AATGAGCTACACCACAAGCACTGGTCGAATCCAATGGAAGTACCACTTCCAGAAGCTCCC 13314 

Qy .1561 CACATGAAAATCTATTGTATATACGGGGTGAACAACCCAACTGAAAGGGCATATGTATAT 1620 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 13315 CACATGAAAATCTATTGTATATACGGGGTGAACAACCCAACTGAAAGGGCATATGTATAT 13374 

Qy 1621 AAG G AAG AG GAT GAC TCCTCTGCTCT GAAT T T G ACC AT CG AC T AC GAAAG C AAG C AAC C T 1680 

I I I I I I I I I I I I I I I II fl I I I I II I I M I I I I I I I I II I I I I I I I I II I I I I I I I II II 
Db 13375 AAG G AAG AGG AT GAC TCCTCTGCTCT GAAT T T GAC CAT C GAC T AC GAAAG C AAG C AACC T 13434 

Qy 1681 GTATTCCTCACCGAGGGGGACGGAACCGTTCCGCTCGTGGCGCATTGAATGTGTCACAAA 1740 

I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 13435 GTATTCCTCACCGAGGGGGACGGAACCGTTCCGCTCGTGGCGCATTCAATGTGTCACAAA 13494 

Qy 1741 TGGGCCCAGGGTGCTTCACCGTACAACCCTGCCGGAATTAACGTTACTATTGTGGAAATG 1800 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 
Db 134 95 TGGGCCCAGGGTGCTTCACCGTACAACCCTGCCGGAATTAACGTTACTATTGTGGAAATG 13554 

Qy 1801 AAAC ACC AG C C AG AT CG AT T TG AT AT AC G T G G T G GAG C AAAAAG C GC C G AAC AC G TAG AC 18 60 

I I M I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I || I I I I I I I 
Db 13555 AAACACCAGCCAGATCGATTTGATATACGTGGTGGAGCAAAAAGCGCCGAACACGTAGAC 13614 

Qy 18 61 ATCCTCGGCAGCGCGGAGTTGAACGATTACATCTTGAAAATTGCAAGCGGTAATGGCGAT 1920 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I.I I 
Db 13615 ATCCTCGGCAGCGCGGAGTTGAACGATTACATCTTGAAAATTGCAAGCGGTAATGGCGAT 13674 

Qy 1921 CTCGTCGAGCCACGCCAATTGTCTAATTTGAGCCAGTGGGTTTCTCAGATGCCCTTCCCA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 13675 CTCGTCGAGCCACGCCAATTGTCTAATTTGAGCCAGTGGGTTTCTCAGATGCCCTTCCCA 13734 

Qy 1981 ATGTAA 198 6 

I I I I I I 

Db 13735 ATGTAA 13740 



